Objetivos de Aprendizagem
- Identificar os componentes principais de um kernel CUDA usando o especificador __global__
- Implementar alocação de memória em dispositivo e transferência de dados entre Host e Dispositivo
- Calcular índices globais de thread para mapear elementos de dados para threads individuais da GPU
- Executar e sincronizar o lançamento paralelo de um kernel usando configurações de grade e bloco